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摘要 HOE (Cinnamomum camphora) 叶 绿 体 基因 组 密码 子 偏好 性 使 用 模式 ， 该 研究 利 
] CodonW, EMBOSS, R 语言 等 软件 和 程序 ， 对 53 条 樟树 叶绿体 基因 组 密码 子 使 用 模式 
及 偏好 性 进行 了 系统 分 析 。 结果 表明 , 樟树 叶绿体 基因 的 有 效 密码 子 数 (ENC) 在 36.82-59.30 
之 间 ， 表 明 密 码 子 的 偏好 性 较 弱 。 相 对 同 义 密 码 子 使 用 度 (RSCU) 分 析 发 现 RSCU>1 的 密码 
子 有 32 个， 其 中 28 DL A, U 结尾 ， 表 明 第 3 位 密码 子 偏好 使 用 A 和 1 碱 基 。 中 性 绘图 
TIRILL GC 与 GCy 的 相关 性 不 显著 ,回归 曲线 斜率 为 0.049， 说明 密码 子 偏好 性 主要 受 
到 自然 选择 的 影响 ， 而 ENC-plot 分 析 中 大 部 分 基因 落 在 曲线 的 下 方 ， 同 样 表明 选择 是 影响 
密码 子 偏好 性 的 主要 因素 。 最终 共 有 9 个 密码 子 (UUU、CUU、UCA、ACA、UAU、AAU、 
GAU、UGA、GGA) 被 鉴定 为 樟树 叶绿体 基因 组 的 最 优 密码 子 。 
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Abstract: Synonymous codons are used with different frequencies among both species and genes 
within the same genome. In order to analyze the codon usage patterns of the chloroplast genome 
of camphora tree, 53 CDS(Coding DNA Sequences)were selected from the chloroplast genome of 
camphora tree and analyzed the codon usage pattern and bias by CodonW, EMBOSS, R language 
and other softwares. The results showed that the effective codon number (ENC) of the chloroplast 
gene ranged from 36.82 to 59.30, indicating that bias of codons was weak. There were 32 codons 
with relative codon usage greater than 1, of which 28 were rich in A and U, indicating that the 3rd 
position of codon prefers A and U genetic bases. Neutral analysis found that the correlation 
between GC3 and GC12 was not significant, and the slope of the regression curve was 0.049, 
suggesting that codon bias was mainly affected by natural selection, while the ENC-plot analysis 


found that most genes fell below and around the curve. It was shown that the mutation also 
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affected the formation of codon bias. Eventually, 9 codons (UUU, CUU, UCA, ACA, UAU, AAU, 
GAU, UGA, GGA) were identified as the optimal codons for the chloroplast genome of camphora 
tree. 
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编码 相同 氨基 酸 的 不 同 密码 子 被 称 为 同 义 密码 子 。 在 生物 体 中 , 同 义 密码 子 的 出 现 具 有 
非 随机 性 , 即 某 一 物种 通常 倾向 于 使 用 一 种 或 几 种 特定 的 密码 子 ， 该 现象 被 称 为 密码 子 使 用 
偏好 性 (Codon usage bias, CUB)(Grantham et al, 1980; Marín et al, 1989). 密码 子 使 用 模式 的 分 
析 从 分 子 生 物 学 层面 揭示 了 基因 调控 、 基 因 表达 、 和 蛋白 质 二 级 结构 、 选 择 性 转录 等 现象 ， 其 
中 不 同 生 物体 密码 子 使 用 产生 偏好 性 是 突变 压力 和 自然 选择 下 的 产生 结果 (Duret & 
Mouchiroud, 1999; Gu et al, 2004; Mg & De Farias, 2006)， 利 用 不 同 物 种 在 密码 子 使 用 上 的 偏 
好 性 ， 可 以 提高 蛋白 表达 的 效率 和 准确 性 (Gerrit & Diarmaid, 2016; Lee et al, 2009). 
叶绿体 是 植物 生命 活动 的 代谢 中 心 ， 在 植物 光合 作用 和 生物 合成 中 具有 重要 作用 (And 
and Emes, 2000)。 植 物 叶绿体 基因 组 由 于 规模 小 、 找 贝 数 多 ， 且 在 分 子 水 平 上 多 个 基因 的 功 
能 已 得 到 验证 , 因此 是 当今 生物 学 领域 的 研究 热点 (Xu et al, 2011)。 从 1986 年 烟草 (Nicotiana 
tabacum)(Shinozaki et al, 1986) 的 和 地 钱 (Ohyama et al, 1986)(Marchantia polymorpha) 的 叶 绿 
体 基 因 组 首次 公布 以 来 ， 目 前 在 NCBI 网 站 上 的 细胞 器 基因 组 数据 库 中 中 已 有 包括 拟 南 芥 
(Arabidopsis thaliana)(Sato et al，1999)、 水 稻 (Oryza sativa)(Hiratsuka et al, 1989). Rf 
(Fragaria X ananassa)(Cheng et al, 2017) RDS8l(Forsythia suspensais)(Wang et al, 2017) 2 fE 
内 的 约 800 种 植物 完整 的 叶绿体 基因 组 信息 。 
樟 属 植物 全 世界 约 250~300 种 ， 我 国 约 有 46 种 ， 主 要 分 布 在 南方 各 省 区 。 这 些 植物 不 
仅 可 用 于 提取 精油 作为 化 工 及 医药 上 的 重要 原料 , 同时 还 是 重要 家 具 、 建 筑 及 雕刻 等 用 材 树 
种 。 作 为 樟 属 植物 中 的 代表 性 植物 ， 樟 树 (Cinnamomum camphora H HA FER X 
用 、 生 态 环 境 建 设 和 生态 文化 等 于 一 体 , 极 具 开 发 和 利用 价值 。2017 E, Chen 等 (Chen et al, 
2017) 对 樟树 叶绿体 基因 组 进行 了 测序 和 分 析 , 结果 显示 樟树 叶绿体 基因 组 全 长 152 570 bp, 
具有 特征 性 的 保守 四 联 体 结构 , 在 编码 区 和 非 编 码 区 都 检测 到 共 40 个 重复 结构 和 83 个 简单 
序列 重复 序列 。 目 前 ， 关 于 樟树 叶绿体 密码 子 使 用 偏好 性 的 研究 还 未 见报 道 。 本 研究 通过 对 
樟树 叶绿体 基因 组 中 53 个 基因 的 密码 子 使 用 的 偏好 性 进行 分 析 ， 在 揭示 影响 密码 子 偏 好 性 
最 主要 因素 的 同时 还 找 出 了 最 优 密码 子 ， 则 在 为 樟 科 植物 叶绿体 基因 组 学 的 研究 葛 定 基础 。 


1 材料 与 方法 


1.1 序列 的 获取 
在 NCBI 数 据 库 (https:Wwww.ncbi.nlm.nih.gov/) 中 下 载 樟树 及 其 他 樟 科 植物 的 叶绿体 基因 
组 信息 。 樟 树叶 绿 体 基因 组 序列 的 Genbank 登录 号 为 MF156716.1， 共 注释 83 条 蛋白 质 编 
码 基因 序列 ， 为 避免 计算 密码 子 偏好 性 时 出 现 样本 偏差 ， 在 剔除 重复 序列 后 ， 最 终 获 得 53 
条 编码 区 长 度 大 于 300 bp HLA ATG 为 起 始 密码 子 ，TAA、TGA 或 TAG 为 终止 密码 子 的 基 
因 序 列 用 于 后 续 分 析 。 
1.2 方法 
1.2.1 密码 子 偏好 性 分 析 

利用 CodonW1.4.2(http://sourceforge.net/projects/codonw) 和 Excel 2013 统计 各 基因 的 密 
码 子 出 现 次 数 (Codon number，CN)、 有 效 密码 子 数 (Effective Number of codon, 
ENC)(Novembre, 2002) 和 同 义 密码 子 相 对 使 用 度 (Relative Synonymous Condon Usage, 
RSCU)(Sharp, Li, 1986)。 用 EMBOSS(http://imed.med.ucm.es/EMBOSS/)' f] CUSP 程序 分 析 
樟树 叶绿体 基因 组 中 各 基因 的 GC 总 含量 和 密码 子 第 1、2、3 位 的 GC 含量 ,分别 用 GCan、 
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GC;. 
因 的 部 分 参数 的 相关 性 及 显著 
1.2.2 中 性 绘图 分 析 
性 绘图 法 的 rm 
子 前 两 位 GCA 
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为 初步 判 
量 的 平均 值 GC 


GC; 和 GC; 表示。GCs 表示 同 义 密码 子 第 3 位 的 GC E 


生 用 R 语言 分 析 并 绘图 。 


。 樟 树叶 绿 体 基 因 组 中 各 基 


断 选 择 或 突变 对 密码 子 使 用 1 


的 碱 基 组 成 在 3 个 位 置 上 无 差异 , 表明 
Y, GC 与 GC; 之 间 相 关 性 不 显著 ， 说 明 


密码 子 人 


密码 子 的 使 用 更 多 地 受到 选择 影响 。 


1.2.3 ENC-plot 绘图 分 析 


ENC-plot 绘 
值 差 异 较 4 
素 。 此 外 ， 
值 越 小 表示 偏好 性 越 强 
性 或 没有 偏好 性 。 用 R 语言 
建 出 ENC 值 的 期 望 曲线 ， 曲 线 


Hd 


图 用 于 分 析 突 变 在 密 
SI, 表明 突变 对 密码 子 偏 好 性 景 


绘制 二 维 散 点 图 ， 横 、 


码 子 使 


模式 中 的 作用 。 


的 公式 如 下 : 


;为 纵 坐 标 ，GC; 为 横 坐 标 ， 
。 在 直线 拟 合 分 析 中 ， 当 回归 系数 接近 1 时 ， GC 5 GC; 间 的 相关 性 显著 ， 密 码 子 
局 好 性 的 主要 决定 因素 为 突变 ; 当 
第 密码 子 3 个 位 置 


"82 大， 反之 选择 为 影响 密码 子 偏好 性 的 主要 因 
还 可 根据 ENC 值 的 高 低 推断 密 码 子 偏好 性 的 强 弱 。ENC 值 的 理论 


好 在 Origin9.1 中 ， 
绘制 散 点 图 并 做 直线 拟 


回归 系数 接 
上 的 的 碱 基 组 成 不 同 ， 则 


当 实 际 ENC 值 与 预期 ENC 


范围 在 21~60， 


。 当 ENC 值 为 20 和 60 两 个 极 值 时 ， 表 示 同 义 密码 子 具有 完全 偏好 
纵 华 标 分 别 为 GC3s M ENC, FE 


图 中 构 


ENC = 2+GCss+29/(GCss2+(1-GCsçs)2) 


1.2.4 PR2-plot 分 析 


为 了 避免 密码 子 第 3 位 的 AT 和 GC 之 间 突 变 不 平衡 ，PR2 偏好 性 分 析 (PR2- bias plot 


analysis) 仅 对 4 种 密码 子 编码 的 氨基 酸 做 密码 子 第 3 位 上 A、T、C 和 G 这 
ueoka, 1999), 并 以 As/(As*T3) | 4 的 值 作为 纵 坐 标 ，Gxy(Gs+C3) | 4 的 值 作为 
其 中 ,“|4” 表 示 四 密码 子 氨基 酸 ， 分 别 为 丙 氨 酸 ， 精 氨 酸 (CGA，CGT， 
亮 氮 酸 (CTA，CTT，CTG，CTC)， 用 


情况 进行 分 析 (S 
横 坐 标 进行 绘图 。 
CGG, CGC), HANE, 


TCG, TCC) HARMA B 


示 碱 基 偏 移 的 程度 和 方向 。 
1.2.5 最 优 密码 子 分 析 

对 前 期 筛选 出 的 53 条 
在 高 低 两 个 基因 库 ! 


码 子 作 为 高 表达 密码 子 。 将 前 文 


条 基 


表达 密码 子 的 结果 相 结 合 ， 从 而 有 


1.2.6 系统 进化 树 的 构建 与 分 析 


与 其 人 
用 BioEdit 手工 校正 比 对 结果 后 
化 树 。 用 Bootstrap method 进行 


2 结果 与 分 析 


X 4 种 碱 基 的 组 成 


上 氨 酸 ， 丝 氨 酸 (TCA， 


TCT, 


PR2-plot 图 的 中 心 点 为 A=T， 


因 的 ENC 值 从 小 到 大 进行 排序 ,两 端 各 选 出 10% 的 基因 
将 对 应 密码 子 的 RSCU 值 相 减 得 到 ARSCU， 选 取 ARSCU > 0.08 的 密 


C=G， 以 该 点 发 出 的 矢量 表 


建 库 ， 


分 析 中 RSCU 值 大 于 1 的 高 频率 密码 子 与 ARSCU > 0.08 高 


角 定 出 最 优 密码 子 ( 胡 莎 莎 等 ， 


因 组 序列 做 多 序列 比 对 分 析 。 
导入 MEGA7.0! 
重复 检验 1000 次 得 出 结果 。 


2.1 樟树 叶绿体 基因 组 密码 子 偏好 性 分 析 


利用 CodonW1.4.2 分 析 樟 树叶 绿 体 基 


显示 ， 平 均 GC 含量 为 39.1%, 
明 在 密 
樟树 叶绿体 基因 


组 密码 子 偏好 性 较 弱 。 
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R 
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ENC 的 取 值 范围 


图 1 结果 表明 ，RSCU 值 大 于 1 的 密码 子 数 


2016; ZZ 


Sh 2015). 


使 用 MAFFT 7.397(Katoh, Standley, 2013)(https://mafft.cbrc.jp/alignment/software/) Y Ft bj 
岂 八 种 樟 科 植物 的 叶绿体 基 


选择 银杏 和 云 杉 作 为 外 类 群 。 


用 系统 邻接 法 (Neighbor-Joining, NJ) 构 建 进 


因 组 中 53 条 候选 基 


且 分 布 趋势 为 GC I(46.81%)>GC,(38.77%)>GC.(31.77%), K 
码 子 的 3 个 位 置 上 GC 并 不 是 均匀 地 分 布 ， 且 第 3 位 密码 子 偏好 使 用 
在 36.82~59.3， 且 大 部 分 在 45 UE, 


因 


的 密码 子 组 成 GK 1)。 结 


ARI U RH. 
说 明 樟 树叶 绿 体 基 


目 为 34 个 。 


中 第 3 位 上 的 碱 基 为 U、A 


` 


和 G 的 数目 分 别 为 16，13 和 2， 这 说 明 U 和 A 为 樟树 叶绿体 基因 组 密码 子 的 偏好 碱 基 。53 


条 基因 的 GC 含量 、ENC 和 CN RH 
极 显 著 相 关 ， 但 GC GC,#l 


显著 相关 ， 说 日 


密码 子 的 使 


1i 


8H GC; 和 密码 子 的 偏好 性 受 基 因 序 列 长 度 的 影响 。 


2.2 中 性 绘图 分 析 
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0.2244-0.5214. GC 与 GC; 的 相关 系数 为 0.143, El 


说 明 两 者 的 相关 性 不 显 


著 ， 密 码 子 第 3 位 与 第 


樟树 叶绿体 基因 密码 子 偏好 性 主要 受到 选择 的 影响 。 


2.3 ENC-plot 绘图 
绘制 ENC-plot 图 


分 析 樟 树叶 绿 体 基 因 组 密码 子 偏好 性 


ij 好 性 受 第 3 位 碱 基 的 


1、2 位 的 进 


从 图 3 可 明显 看 出 , 大 部 分 基因 落 在 期 望 


差异 较 大 ， 也 说 明 樟 树叶 绿 体 基因 组 密码 子 偏 好 性 更 多 受 选 择 的 影响 。 
表 工 樟树 叶绿体 基因 组 各 基因 密码 子 不 同位 置 的 GC 含量 


Table 1 GC content of different position of each gene in the 


基因 GC 
Gene GC GC, 
rpsi2 41.94 51.61 
psbA | 4228 49.72 
matK 36.18 43.88 
atpA 4239 56.30 
atpF 3928 51.35 
atp?! | 39.25 50.00 
rps2 39.38 41.35 
rpoC2 38.72 46.61 
rpoC1 39.67 51.02 
rpoB | 40.56 50.33 
psbD | 42.84 51.69 
psbC | 44.80 5422 
rpsi4 42.24 43.56 
psaB 42.27 49.12 
psaA 4363 53.00 
ycf3 3905 47.34 
rps4 39.11 50.00 
ndh] 42.14 51.57 
ndhK 38.81 42.31 
ndhC 3829 49.59 
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«E 2), GC 和 GC, 的 分 布 范 围 都 较为 集中 ，GCi1 的 范围 在 


分 析 结 果 显 示 ( 表 2)，GCa GC I. GC; 和 GC, € 
GC, 的 相关 性 水 平 不 显著 。ENC 与 GC, 相关 系数 为 0.27， 
影响 。CN 与 GC3、ENC 显著 相关 ， 表 
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化 方式 可 能 存在 一 定 差异 ， 因 此 
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atpE 41.73 37.29 46.89 35.59 29.38 46.18 
atpB 43.02 3431 4020 3529 2745 4823 
rbcL 45.73 34.60 34.70 40.06 29.02 50.14 
accD 37.04 34.81 3826 3799 2819 47.90 
ycfA | 40.72 34.90 3878 3163 3429 53.62 
petA 41.12 3996 5321 4423 2244 47.57 
rpsl8 34.64 40.62 49.04 40.99 31.84 4924 
氨基 酸 密码 子 数目 RSCU 
AA Codon number 
Phe cu B5 EM 
cc BN» Nb 
Leu CCA Bos | 
cce M us Bos 
acu E E 
acc Boo Bs 
aca Mo TH 
aco fiz Wos 
Ile cu EB um 
cc Boo Bee 
ca NE NM 
Met cca B ú Bo» 
Val vau BENE WN 
uc Bio Boo 
UA | 2 ME 
UG | ú Fb 
Ser cau Eo Hias 
cac B 137 Wos 
cAA ME ww 
CAG joo 国 .54 
Arg AAU Wami mus 
AAC W230 国 046 
AAA Wasa was 
AAG M2s0 M052 
GAU M — | 
Gac Wis ë Mog 
Ser Gaa E Å 
GAG Wb Hos: 
Gly UG 国 181 M 


ucc E NN 

ZE: Phe. Z&WjeE&RE?; Leu. RAR; Ile. RRA; Met. EAR; Val, ZEE; Ser. ££ 
AR; Arg. HAR, Gy. 甘氨酸 ; Pro. RAR; Thr. WAR; Ala. WAR; Tyr. BEA 
酸 ; His. AAR; Gin. WAW; Asn， 天 冬 酰胺 ; Lys. MAR; Asp. KAAR ; Glu. 
RAR; Cys， 半 胱 氨 酸 ; Trp. BAR, TER 表示 有 空白 或 内 部 终止 符号 的 氨基 酸 。 下 同 。 


Note: Phe. Phenylalanine; Leu. Leucine; Ile. Isoleucine; Met. Methionine; Val. 
Valine; Ser. Serine; Arg. Argnine; Gly. Glycine; Pro. Proline; Thr. Threonine; Ala. 
Alanine; Tyr. Tyrosine; Hls. Hlstidine; Gln. Glutamine; Asn. Asparagine; Lys. Lysine; 
Asp. Aspartic acid; Glu. Glutamic acid; Cys. Cysteine; Trp. Tryptophane; TER 
indicates an amino acid with a blank or internal termination symbol. The same below. 
图 1 樟树 叶绿体 基因 组 同 义 密码 子 使 用 频率 


Fig.1 Relative synonymous codons usage analysis in the chloroplast of C.camphora 


表 2 樟树 叶绿体 基因 组 中 各 参数 的 相关 性 


Table 2 Correlation analysis of each parameters in the chloroplast genome of C.camphora 


项 目 Item Gean GC1 GC2 GC3 ENC CN 
Gcall 1.000 
GCI 0.722** 1.000 
GC2 0.662** 0.193 1.000 
GC3 0.487** 0.058 0.020 1.000 
ENC -0.066 0.074 -0.428*** 0.274* 1.000 
CN -0.207 -0.165 0.355 0.186 0.262* 1.000 


注 : * 表 示 相 关 性 达到 显著 水 平 (P<0.05)，** 表 示 相 关 性 达到 极 显 著 水 平 (P<0.01)。 


Note: * stands for significant correlation at the 0.05 level; 


** stands for significant correlation at the 0.01 level. 
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图 2 樟树 叶绿体 基因 组 中 性 绘图 分 析 
Fig.2 Neutrality plot analysis in the chloroplast of C.camphora 


* 2 樟树 叶绿体 基因 组 最 优 密码 子 分 析 


Table 2 GC content of different position of genes in the chloroplast genome of C.camphora 
AER 密码 子 高 表达 基因 High expressed gene ， 低 表达 基因 Low expressed gene 


Amino acid Codon Number RSCU Number RSCU ud 

Phe UUU * 28 1.08 16 0.84 0.24 
UUC 24 0.92 22 1.16 -0.24 

Leu UUA 19 1.34 19 1.84 -0.5 
UUG 19 1.34 17 1.65 -0.31 

CUU * 23 1.62 15 1.45 0.17 

CUC * 6 0.42 0 0 0.42 

CUA 9 0.64 10 0.97 -0.33 

CUG *** 9 0.64 1 0.1 0.54 

Ile AUU 34 1.15 33 1.52 -0.37 
AUC * 26 0.88 16 0.74 0.14 

AUA * 29 0.98 16 0.74 0.24 

Met AUG 26 1 22 1 0 
Val GUU 28 1.53 18 1.53 0 

GUC 6 0.33 6 0.51 -0.18 

GUA 23 1.26 20 1.7 -0.44 

GUG *** 16 0.88 3 0.26 0.62 

Ser UCU 20 1.82 21 2 -0.18 
UCC 10 0.91 12 1.14 -0.23 

UCA ** 11 1 7 0.67 0.33 

UCG 5 0.45 5 0.48 -0.03 

Pro CCU 17 1.15 18 1.67 -0.52 
CCC * 21 1.42 13 1.21 0.21 

CCA 16 1.08 11 1.02 0.06 

CCG * 5 0.34 1 0.09 0.25 

Thr ACU 11 1.16 19 1.65 -0.49 
ACC 11 1.16 15 1.3 -0.14 

ACA * 10 1.05 11 0.96 0.09 

ACG *** 6 0.63 1 0.09 0.54 

Ala GCU 27 1.66 32 2.21 -0.55 
GCC ** 12 0.74 6 0.41 0.33 

GCA 21 1.29 18 1.24 0.05 

GCG * 5 0.31 2 0.14 0.17 

Tyr UAU ** 45 1.76 17 1.42 0.34 
UAC 6 0.24 7 0.58 -0.34 

TER UAA 2 1.2 4 24 -1.2 
UAG *** 1 0.6 0 0 0.6 

His CAU 11 1.38 15 1.36 0.02 


CAC 5 0.63 7 0.64 -0.01 


GIn CAA 30 1.36 19 1.36 
CAG 14 0.64 9 0.64 

Asn AAU *** 38 1.73 20 1.18 
AAC 6 0.27 14 0.82 

Lys AAA 25 1.28 29 1.53 
AAG* 14 0.72 9 0.47 

Asp GAU ** 37 1.72 11 1.38 
GAC 6 0.28 5 0.63 

Glu GAA 54 1.5 28 1.6 
GAG 18 0.5 7 0.4 

Cys UGU 5 1 7 1.75 
UGC *** 5 1 1 0.25 

TER UGA *** 2 1.2 1 0.6 

Trp UGG 18 1 15 1 

Arg CGU 14 1.25 22 1.67 
CGC * 5 0.45 4 0.3 

CGA 15 1.34 18 1.37 

CGG ** 6 0.54 2 0.15 

AGA 16 1.43 27 2.05 
AGG *** 11 0.99 6 0.46 
Ser AGU 14 1.27 13 1.24 
AGC 6 0.55 5 0.48 

Gly GGU 22 1.19 29 1.71 
GGC 11 0.59 9 0.53 

GGA * 30 1.62 23 1.35 

GGG * 11 0.59 7 0.41 

注 ，* 表 示 最 优 密码 子 。 
Note: *represents the optimal codons. 


ENC 


图 3 樟树 叶绿体 基因 组 ENC-plot 绘图 分 析 
Fig.3 Analysis of ENC-plot in the chloroplast of C.camphora 
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图 4 樟树 叶绿体 基因 组 PR2-plot 分 析 
Fig.4 Analysis of PR2-plot in the chloroplast of C.camphora 


云 杉 Picea asperata 
银杏 Ginkgo biloba 


沉 水 樟 Cinnamomum micranthum 


樟 Cinnamomum camphora 
5t& hi Endiandra discolor 
VAST Litsea glutinosa 


LEE Persea americana 


I 


0.05 锡 兰 肉桂 Cinnamomum verum 


注 : NCBI 登录 号 : MaR KU382356.1; 沉 水 樟 NC_035802.1; Mii KT348516.1; 
$528 KX437771.1; 锡 兰 肉桂 NC_035236.1; 锈 毛 润 楠 KT348517.1; 异 色 土 杭 KX674308.1; 
银杏 JN867585.1; 云 杉 NC 032367.1; 樟树 MF156716.1; Bi NC 036143.1. 
Note: ID number in NCBI: Litsea glutinosa KU382356.1; Cinnamomum micranthum 
NC. 035802.1; Machilus yunnanensis KT348516.1; Persea americana KX437771.1; 
Cinnamomum verum NC. 035236.1; Machilus balansae KT348517.1; Endiandra discolor 
KX674308.1; Ginkgo biloba JN867585.1; Picea asperata NC. 032367.1; Cinnamomum camphora 
MF156716.1; Phoebe zhennan NC. 036143.1). 
图 5 樟 科 叶绿体 基因 组 系统 进化 树 


Fig.5 Phylogenetic tree based on chloroplast genome sequence of Lauraceae 
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图 6 沉 水 樟 叶 绿 体 基 因 组 中 性 绘图 分 析 图 7 沉 水 樟 叶 绿 体 基 因 组 ENC-plot 分 析 
Fig.7 Analysis of neutrality plot of C.micranthum Fig.8 Analysis of ENC-plot of C.micranthum 


2.4 PR2-plot 分 析 
通过 PR2-plot 绘图 进一步 分 析 樟 树叶 绿 体 基因 组 密码 子 偏好 性 的 影响 (图 4)。 当 A. T. 
C 和 G 四 种 碱 基 的 使 用 频率 ， 即 A=T，C=G 时 ， 密 码 子 使 用 偏好 性 不 受 选择 和 突变 影响 
(Sueoka, 2001)。 研 究 发 现 ，4 个 区 域 中 的 基因 位 点 分 布 并 不 均匀 ， 左 上 方位 置 的 个 数 较 多 ， 
说 明 在 第 3 位 碱 基 的 选择 上 密码 子 具 有 偏好 性 ， 且 碱 基 A 的 使 用 频率 高 于 T， 碱 基 C 的 使 
用 频率 高 于 G。 因 此 可 推论 选择 是 樟树 叶绿体 基因 组 密码 子 偏好 性 的 主要 影响 因素 。 
2.5 最 优 密码 子 的 确定 

对 53 个 候选 基因 的 ENC 值 进 行 排序 后 ， 从 两 端 各 选取 10% 的 基因 建立 高 、 低 表达 基 
因 库 ， 然 后 计算 两 个 表达 库 中 密码 子 的 RSCU 值 和 两 个 库 中 的 ARSCU 值 ( 表 2)。 最 后 确定 
了 26 个 密码 子 为 樟树 叶绿体 基因 组 高 表达 密码 子 。 对 26 个 密码 子 的 第 3 位 碱 基 进 行 分 析 ， 
其 中 如 结尾 的 有 5 个 ， 以 A 结尾 的 有 5 个 ， 以 C、G 结尾 的 分 别 为 6 个 和 10 个。 结合 26 
个 高 表达 密码 子 和 图 1 的 32 个 高 频密 码 子 ， 选 取 两 者 的 公共 部 分 ， 最 后 确定 了 9 个 樟树 叶 
绿 体 基因 组 最 优 密码 子 ， 分 别 为 UUU、CUU、UCA、ACA、UAU、AAU、GAU、UGA、 
= GGA。 其 中 ， 所 有 密码 子 均 以 U 或 A 结尾 。 
= 2.6 系统 进化 树 的 构建 与 分 析 
FT 比较 叶绿体 基因 组 序列 可 以 揭示 近 缘 物种 类 群 之 间 的 系统 进化 关系 , TRIESTE P] BH RJ ERE 
化 模式 (Kim et al., 2015)。 为 深入 了 解 樟树 在 樟 科 植物 的 进化 规律 和 关系 ， 将 樟树 与 其 他 八 
种 樟 科 植 物 的 叶绿体 基因 组 序列 共同 构建 系统 进化 树 , 选取 裸子 植物 的 银杏 和 云 杉 为 外 类 群 
(图 9)。 结 果 显 示 ， 樟 科 植 物 的 叶绿体 基因 组 单独 聚 为 一 枝 ， 与 外 类 群 区 分 明显 。 樟 树 与 沉 
水 樟 的 叶绿体 基因 组 亲缘 关系 最 近 , 且 两 者 均 为 樟 科 樟 属 植 物 成 员 , 因此 推测 可 能 两 者 可 能 
具有 相似 的 密码 子 偏 好 性 模式 。 利 用 相同 的 方法 对 沉 水 樟 叶绿体 基因 组 进行 中 性 绘图 (图 6) 
和 ENC-plot 绘图 (图 7) 分 析 , ÆI GC, 与 GC, 的 回归 系数 接近 0( 为 0.053), 同样 在 ENC-plot 
绘图 中 , 大 部 分 基因 落 在 期 望 曲线 的 下 方 , 两 者 都 说 明 选 择 是 影响 沉 水 樟 叶 绿 体 基 因 组 密码 
子 偏好 性 的 主要 因素 , 这 也 与 樟树 的 分 析 结 果 类 似 , 表明 樟 科 或 樟 属 植物 在 进化 过 程 中 自然 
选择 因素 对 叶绿体 基因 组 密码 子 偏 好 性 的 影响 较 大 。 
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3 讨论 
同 义 密码 子 在 不 同 物种 间 和 同一 基因 组 内 的 不 同 基 因 间 使 用 都 具有 一 定 偏好 性 , 高 表达 
量 的 基因 通常 具有 最 优 密码 子 并 且 其 密码 子 偏 好 性 往往 更 强 (Ghaemmaghami et al, 2003; 
Goetz & Fuglsang, 2005; Ingvarsson, 2007). Zhou(Zhou et al, 2008b) 等 的 研究 发 现 ， 植 物 叶 绿 
体 基 因 组 中 ， 密 码 子 结尾 处 的 碱 基 更 偏好 使 用 A 或 T。 本 研究 发 现在 樟树 叶绿体 基因 组 中 
GC; 5 GC,. GC; 相关 不 显著 ， 且 GC 的 比例 为 三 者 中 最 低 ， 因 此 也 得 到 类 似 的 结果 ， 即 偏 
好 密码 子 多 以 A 或 工 结尾 ， 这 也 与 苹果 (Malus X domestica)( 金 桂花 等 ,2014)、 杉 木 
(Cunninghamia lanceolata)( 郑 微 玮 等 , 2016) 和 柿 (Diospyros kaki)( 傅 建 敏 等 , 2017) 等 植物 的 密 
码 子 偏好 性 研究 结果 一 致 。 
密码 子 偏好 性 的 形成 原因 受 多 种 因素 影响 ， 除 了 最 主要 的 突变 和 自然 选择 (Rao et al, 
2011) 外 , 碱 基 组 成 差异 (Romero et al, 2000)、 基 因 编 码 结构 (Rao et al, 2011)、tRNA 丰 度 (CNovoa 
& Pouplana, 2012) 等 多 种 因素 也 会 影响 其 偏好 性 。 其 中 tRNA 的 表达 丰 度 最 高 ， 相 应 的 密码 
子 偏好 性 就 越 强 (Duret, 2002; Hershberg & Petrov, 2008)。 本 研究 通过 对 樟树 叶绿体 基因 组 三 
| 个 不 同位 置 上 的 密码 子 碱 基 组 成 及 密码 子 相关 系数 进行 研究 ， 经 中 性 分 析 、ENC-plot 分 析 
> 和 PR2-plot 等 分 析 后 发 现 ， 选 择 是 影响 樟树 叶绿体 基因 组 密码 子 偏好 性 的 主要 因素 ， 突 变 
对 密码 子 的 偏好 性 影响 较 小 。 在 陆地 棉 (Gossypium hirsutum)( 尚 明 照 等 ， 2011)、 麻 子 
(Panicum miliaceum) (XJF, 2017)、 普 通 油茶 (Camellia oleifera)( 王 鹏 良 等 , 2018) 等 植物 的 
叶绿体 基因 组 密码 子 仿 好 性 分 析 中 ， 也 得 到 了 与 本 研究 相似 的 结果 。 然 而 ,在 对 拟 南 芥 和 杨 
树 (Zhou et al, 2008) 叶 绿 体 基因 组 密码 子 偏好 性 的 研究 中 发 现 ， 突 变 是 主要 的 影响 因素 。 由 
此 可 见 植 物 密 码 子 偏好 性 受 多 重 因素 共同 影响 , 且 影响 不 同 植物 密码 子 偏好 性 的 主要 因素 也 
不 同 。 
在 强 的 正 向 选择 和 突变 压力 的 作用 下 往往 会 形成 大 量 的 最 优 密码 子 , 相反 在 纯化 选择 和 
突变 压力 作用 下 最 优 密码 子 数目 相对 较 少 (Hershberg & Petrov, 2008; RIESE, 2015)。 本 研究 
将 高 频密 码 子 和 高 表达 密码 子 分 析 相 结合 , JE H 9 个 樟树 叶绿体 基因 组 中 的 最 优 密码 子 ， 
且 这 些 密码 子 都 以 A 和 U 碱 基 结 尾 , 该 结果 与 前 人 在 世 获 首 蒂 ( 杨 国 锋 等 , 2015)、 水 稻 (Zhou 
et al, 2008a) 等 植物 的 中 的 研究 相 吻 合 。 在 系统 进化 树 中 , 分 校 越 长 的 物种 表明 其 进化 速率 与 
树 中 的 其 他 成 员 相 比 更 快 , 进化 树 中 异 色 土 楠 自 成 一 枝 且 分 梳 相 对 较 长 , 这 也 与 前 人 发 现 它 
是 在 进化 中 首先 与 其 他 樟 科 植物 分 离 的 物种 的 观点 相 吻合 (Hinsinger and Strijk, 2017)。 同 时 ， 
通过 分 析 发 现 樟树 与 沉 水 樟 的 密码 子 偏好 性 都 主要 受到 选择 的 影响 , 说 明 杂 缘 关 系 越 近 的 物 
种 可 能 具有 越 相 似 的 密码 子 偏好 性 。 本 研究 对 今后 提高 目的 基因 的 表达 效率 具有 重要 作用 ， 
而 樟 科 植物 叶绿体 基因 组 密码 子 分 析 也 将 为 今后 被 子 植物 的 系统 发 育 研究 提供 重要 的 参考 
价值 (Moore et al, 2007; Ruhfel et al, 2014). 
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